deliberative alignment(熟考的整合)
LLMに倫理原則の記述を与えるだけで,それに沿った振る舞いをさせられる.
以前のように,この行動は良い/悪いという評価をたくさんフィードバックする形で教え込まなくて良くなる
論文
Deliberative Alignment: Reasoning Enables Safer Language Models
関連
【用語解説】熟慮的アライメントとは? - AILANDs https://dc-okinawa.com/ailands/deliberative-alignment/
ーーー
2025/2/2 19:02
original:/tomiokario-close/deliberative alignment(熟考的整合)
ーーー